3.4.2 시뮬레이션 기술의 도약: Isaac Gym, MuJoCo MJX 등 GPU 병렬 시뮬레이션과 물리 엔진의 발전

3.4.2 시뮬레이션 기술의 도약: Isaac Gym, MuJoCo MJX 등 GPU 병렬 시뮬레이션과 물리 엔진의 발전

로봇 공학, 특히 데이터 기반의 로봇 학습(Robot Learning) 분야는 지난 수십 년간 끊임없는 계산 효율성의 장벽과 싸워왔다. 딥러닝(Deep Learning)과 강화학습(Reinforcement Learning, RL)이 컴퓨터 비전과 자연어 처리 분야를 혁명적으로 변화시키는 동안, 로봇 제어 분야는 상대적으로 느린 진보를 보였다. 그 근본적인 원인 중 하나는 물리 세계의 상호작용 데이터를 수집하는 비용이 극도로 높다는 점이었다. 실제 로봇을 구동하여 데이터를 얻는 것은 시간적, 비용적, 안전상의 제약이 따르며, 이를 대체하기 위해 도입된 시뮬레이션 기술조차도 오랫동안 연산 속도의 한계에 갇혀 있었다.

본 절에서는 로봇 학습의 패러다임을 근본적으로 전환시킨 GPU 병렬 시뮬레이션(GPU Parallel Simulation) 기술의 도약과 차세대 물리 엔진의 발전 과정을 심도 있게 분석한다. CPU 중심의 전통적 시뮬레이션 파이프라인이 가졌던 구조적 한계를 규명하고, NVIDIA의 Isaac Gym, Google DeepMind의 MuJoCo MJX 및 Brax, 그리고 최신 Genesis와 ManiSkill 등 혁신적인 플랫폼들이 어떻게 수만 개의 환경을 단일 GPU에서 실시간보다 수천 배 빠르게 구동할 수 있는지 그 아키텍처적 원리를 파헤친다. 나아가 이러한 기술적 진보가 심투리얼(Sim-to-Real) 전이, 미분 가능 물리학(Differentiable Physics), 그리고 범용 로봇 지능(General Purpose Robot Intelligence) 실현에 미치는 파급 효과를 포괄적으로 고찰한다.

1. 전통적 시뮬레이션의 한계와 CPU-GPU 데이터 전송 병목

GPU 기반 시뮬레이션의 혁신성을 이해하기 위해서는 먼저 기존 CPU 기반 시뮬레이션이 직면했던 구조적 병목 현상을 명확히 이해해야 한다. Gazebo, PyBullet, 그리고 초기 버전의 MuJoCo와 같은 전통적인 물리 엔진들은 기본적으로 CPU(Central Processing Unit) 아키텍처에 최적화되어 설계되었다. CPU는 복잡한 분기 예측(Branch Prediction)과 순차적 처리(Sequential Processing)에 특화되어 있어, 정교한 물리 연산이나 단일 로봇의 고정밀 제어에는 적합했다. 그러나 대규모 데이터를 요구하는 딥러닝 기반 강화학습이 도입되면서 상황은 급변하였다.

1.1 이종 컴퓨팅 아키텍처의 비효율성

전통적인 심층 강화학습 파이프라인은 전형적인 이종 컴퓨팅(Heterogeneous Computing) 구조를 따랐다.

  1. 물리 연산 (CPU): 강체 동역학(Rigid Body Dynamics), 충돌 감지(Collision Detection), 보상 계산 등이 CPU 클러스터에서 수행된다.
  2. 데이터 전송 (PCIe Bus): CPU에서 생성된 상태(State, s_t)와 보상(Reward, r_t) 데이터는 시스템 메모리(RAM)에서 GPU 메모리(VRAM)로 복사된다.
  3. 정책 학습 및 추론 (GPU): GPU에 상주하는 신경망(Policy Network)이 입력된 상태를 바탕으로 행동(Action, a_t)을 추론하거나 그래디언트를 계산하여 가중치를 업데이트한다.
  4. 데이터 반환 (PCIe Bus): 계산된 행동 값은 다시 GPU에서 CPU로 전송되어 물리 엔진의 액추에이터 명령으로 입력된다.

이러한 구조에서 가장 치명적인 병목은 PCI-Express(PCIe) 버스를 통한 데이터 전송 대역폭과 레이턴시였다.1 시뮬레이션 스텝(Step)은 보통 60Hz에서 수 kHz의 빈도로 발생하는데, 매 스텝마다 대규모의 상태 텐서와 행동 텐서를 CPU와 GPU 사이에서 왕복시키는 오버헤드(Overhead)는 실제 연산 시간보다 더 많은 시간을 소모하게 만들었다.

1.2 확장성의 한계 (Scalability Wall)

OpenAI의 연구 사례 2에 따르면, MuJoCo를 이용해 대규모 강화학습을 수행할 때 수백 개의 CPU 코어를 사용하더라도 전체 학습 파이프라인의 효율은 GPU의 연산 능력을 따라가지 못했다. CPU는 병렬 처리를 위해 멀티프로세싱(Multi-processing)을 사용해야 하는데, 이는 프로세스 간 통신(IPC) 비용과 컨텍스트 스위칭(Context Switching) 비용을 수반한다. 반면, 신경망 학습을 담당하는 GPU는 수천 개의 코어를 가진 대규모 병렬 처리 장치임에도 불구하고, CPU로부터 데이터가 도착하기를 기다리는 유휴 상태(Idle State)가 빈번히 발생하였다. 결과적으로 “데이터 생성(Simulation)” 속도가 “데이터 소비(Learning)” 속도를 따라가지 못하는 불균형이 심화되었고, 이는 복잡한 로봇 작업을 학습시키는 데 며칠 혹은 몇 주가 소요되는 주된 원인이 되었다.

2. GPU 네이티브 시뮬레이션과 텐서 API 혁명

이러한 병목을 해소하기 위해 등장한 것이 GPU 네이티브(Native) 시뮬레이션 기술이다. 이 접근법의 핵심은 물리 엔진 자체를 CUDA 커널 등으로 재작성하여 GPU 상에서 구동하고, 렌더링과 신경망 학습까지 모든 과정을 단일 GPU 메모리 내에서 처리하는 것이다.

2.1 Isaac Gym: 엔드투엔드 GPU 파이프라인의 개척자

NVIDIA가 공개한 Isaac Gym은 로봇 학습 분야의 게임 체인저(Game Changer)로 평가받는다. Isaac Gym은 물리 시뮬레이션의 결과를 CPU로 복사하지 않고, GPU 메모리 주소를 직접 가리키는 텐서(Tensor) 형태로 제공한다.3

2.1.1 제로 카피(Zero-Copy) 텐서 아키텍처

Isaac Gym의 가장 큰 기술적 특징은 PyTorch 텐서 API를 통한 물리 상태의 직접 접근이다.

  • 기존 방식: Physics Engine (CPU) -> RAM -> PCIe -> VRAM -> PyTorch Tensor (GPU)
  • Isaac Gym 방식: Physics Engine (GPU) -> VRAM (Pointer mapping) -> PyTorch Tensor (GPU)

이 구조에서는 데이터 복사가 전혀 발생하지 않는다(Zero-Copy). 사용자가 Python 코드에서 gym.acquire_dof_state_tensor()와 같은 함수를 호출하면, 물리 엔진이 내부적으로 사용하는 데이터 버퍼를 PyTorch 텐서로 래핑(Wrapping)하여 반환한다.4 이 텐서에 대한 연산(예: 관측 정규화, 보상 계산)은 즉시 GPU 상에서 수행되며, 신경망의 입력으로 직행한다. 마찬가지로 신경망이 출력한 행동 텐서 역시 메모리 복사 없이 물리 엔진의 힘(Force) 또는 토크(Torque) 버퍼로 매핑된다.

2.1.2 대규모 병렬 환경(Massive Parallel Environments)의 구현

Isaac Gym은 단일 GPU에서 수천 개에서 수만 개의 독립적인 환경(Environment)을 동시에 시뮬레이션한다. 이는 전통적인 물리 엔진이 단일 월드(World) 내의 상호작용을 처리하는 방식과 달리, GPU의 SIMT(Single Instruction, Multiple Threads) 아키텍처를 활용하여 동일한 물리 법칙을 적용받는 서로 다른 상태의 수만 개 평행 우주를 동시에 계산하는 것과 같다. 이로 인해 CPU 클러스터 없이도 워크스테이션 한 대에서 수만 FPS(Frames Per Second) 이상의 시뮬레이션 속도를 달성할 수 있게 되었다.5

특징CPU 기반 파이프라인 (Legacy)GPU 기반 파이프라인 (Isaac Gym)
물리 연산 위치CPUGPU
병렬 처리 방식멀티프로세싱 (MPI, Ray 등)단일 커널 내 병렬 환경 (CUDA)
데이터 전송CPU \leftrightarrow GPU (PCIe 병목 발생)GPU 메모리 내 직접 접근 (Zero-Copy)
학습 속도 (Ant)수천 FPS (수백 코어 사용 시)수십만~수백만 FPS (단일 GPU)
인프라 비용고비용 (CPU 클러스터 필요)저비용 (단일 워크스테이션)

표 3.4.2-1. CPU 기반 시뮬레이션과 GPU 기반 시뮬레이션 파이프라인 비교

2.2 Isaac Lab: 옴니버스(Omniverse) 기반의 확장

Isaac Gym의 성공을 바탕으로 NVIDIA는 이를 옴니버스(Omniverse) 플랫폼과 통합하여 Isaac Lab으로 발전시켰다. Isaac Lab은 USD(Universal Scene Description) 포맷을 기반으로 하여 더 정교한 물리 재질 표현과 포토리얼리스틱(Photorealistic) 렌더링을 지원한다.6 특히 Isaac Lab은 강화학습뿐만 아니라 모방 학습(Imitation Learning), 로봇 조작(Manipulation), 보행(Locomotion) 등 다양한 과제를 위한 모듈화된 설계를 제공하며, 타일드 렌더링(Tiled Rendering) 기술을 통해 시각적 관측(Visual Observation) 데이터까지 GPU 병렬로 생성할 수 있는 기능을 강화하였다.

3. JAX 기반 미분 가능 물리: MuJoCo MJX와 Brax

NVIDIA가 CUDA 생태계를 기반으로 물리 엔진을 혁신했다면, Google 진영은 JAX 프레임워크를 중심으로 물리 엔진의 미분 가능성(Differentiability)과 하드웨어 가속(XLA)을 결합하는 방향으로 나아갔다.

3.1 MuJoCo MJX (MuJoCo XLA)

MuJoCo는 오랫동안 로봇 연구의 표준(Gold Standard) 물리 엔진으로 군림해왔다. 정확한 접촉 역학(Contact Dynamics)과 안정적인 시뮬레이션으로 유명했지만, 본래 C/C++ 기반의 CPU 엔진이었다. Google DeepMind는 MuJoCo를 JAX로 완전히 재작성하여 MuJoCo MJX를 공개하였다.7

  • XLA 컴파일과 커널 융합(Kernel Fusion): MJX는 물리 시뮬레이션의 각 단계를 JAX의 기본 연산(Primitive)으로 표현한다. 이는 XLA 컴파일러를 통해 분석되어, 불필요한 메모리 접근을 줄이고 연산을 융합(Fusion)한 최적화된 GPU/TPU 커널로 컴파일된다.
  • 이형성(Heterogeneity) 지원: MJX는 jax.vmap을 활용하여 수천 개의 환경을 벡터화할 수 있다. 특히, JAX의 동적 컴파일 특성을 활용하여 물리 파라미터가 서로 다른 이형적인 환경들을 효율적으로 병렬 처리할 수 있다는 장점을 가진다.8

3.2 Google Brax: RL 라이브러리와 물리 엔진의 결합

Brax는 JAX로 작성된 미분 가능한 물리 엔진이자 강화학습 라이브러리이다.9 Brax의 설계 철학은 물리 엔진을 단순한 블랙박스가 아닌, 최적화 가능한 연산 그래프의 일부로 보는 것이다.

  • 미분 가능성(Differentiability)과 분석적 그래디언트: Brax(및 MJX)의 가장 큰 특징은 시뮬레이션 스텝 함수가 미분 가능하다는 점이다. \nabla_{\text{action}} \text{NextState}와 같은 야코비안(Jacobian)을 계산할 수 있어, PPO와 같은 그래디언트 추정(Gradient Estimation) 방식 대신 **분석적 정책 그래디언트(Analytic Policy Gradients, APG)**를 사용하여 학습 효율을 획기적으로 높일 수 있다.10 이는 수백만 번의 샘플링이 필요한 작업을 수천 번의 미분 계산으로 단축시킬 수 있는 잠재력을 가진다.
  • 다양한 물리 백엔드: Brax는 Generalized Coordinates(MuJoCo 스타일), Position Based Dynamics(PBD), Spring Mass 등 다양한 물리 해석 방식을 지원하며, 사용자의 목적(정확성 vs 속도 vs 안정성)에 따라 선택적으로 사용할 수 있다.11 현재 Brax는 MJX를 백엔드로 통합하여 MuJoCo의 정밀함과 JAX의 병렬성을 동시에 제공하는 방향으로 진화하고 있다.12

4. 초고속 범용 시뮬레이터와 시각적 학습의 진화

GPU 시뮬레이션 기술은 이제 단순한 강체 역학을 넘어 유체, 연체 등 다물리(Multi-physics) 시뮬레이션과 초고속 렌더링을 포함하는 방향으로 발전하고 있다.

4.1 Genesis: 생성형 AI와 4,300만 FPS의 충격

최근 발표된 Genesis 시뮬레이터는 물리 시뮬레이션의 새로운 성능 기준을 제시하였다. Genesis는 “Universal Physics Engine“을 표방하며, 강체뿐만 아니라 연체, 유체 등을 통합된 프레임워크에서 처리한다.13

  • 4,300만 FPS 성능의 의미: Genesis는 RTX 4090 GPU 하나에서 Franka 로봇 팔 조작 환경을 시뮬레이션할 때 4,300만 FPS라는 경이적인 속도를 달성했다고 보고하였다.14 이는 실시간(Real-time) 대비 약 43만 배 빠른 속도이다. 비록 이것이 렌더링을 제외하고 물리 연산에 집중된 최적화 결과라 할지라도, 기존 Isaac Gym이나 MJX 대비 수십 배 이상의 성능 향상을 보여주는 것이다.15 이러한 속도는 진화 연산(Evolutionary Computation)이나 대규모 집단 학습(Population-based Training)과 같이 막대한 샘플을 요구하는 알고리즘의 실용성을 크게 높인다.
  • 생성형 데이터 파이프라인: Genesis는 거대 언어 모델(LLM)과 생성형 AI를 통합하여, 자연어 명령만으로 시뮬레이션 환경(지형, 객체 배치, 로봇 구성)을 자동으로 생성하는 기능을 내장하고 있다. 이는 “데이터 부족” 문제를 “데이터 생성 자동화“로 해결하려는 시도이다.16

4.2 SAPIEN과 ManiSkill: 시각 기반 조작의 혁신

로봇 조작(Manipulation) 작업, 특히 시각 정보(RGB-D)를 활용하는 작업에서는 물리 연산보다 **렌더링(Rendering)**이 병목이 되는 경우가 많다. SAPIEN 엔진과 이를 기반으로 한 ManiSkill 벤치마크는 이 문제를 해결하는 데 집중하였다.17

  • 렌더 서버(Render Server) 아키텍처: ManiSkill2와 3는 렌더링 자원을 효율적으로 관리하기 위해 비동기식 렌더 서버 아키텍처를 도입하였다. 이를 통해 다수의 환경이 GPU 렌더링 파이프라인을 공유하며 메모리 사용량을 최소화한다.
  • 초고속 병렬 렌더링: ManiSkill3는 Vulkan 및 CUDA 기반의 레이트레이싱(Ray-tracing)을 지원하면서도, RGB-D 센서 데이터 생성 속도를 30,000 FPS 이상(RTX 4090 기준)으로 끌어올렸다.19 이는 고품질의 시각적 피드백을 실시간보다 수백 배 빠르게 생성할 수 있음을 의미하며, Visual RL 에이전트가 수백만 장의 이미지를 학습하는 시간을 획기적으로 단축시킨다.
  • PartNet-Mobility: SAPIEN은 단순한 기하학적 도형이 아닌, 실제 사물처럼 작동하는(문이 열리고, 서랍이 당겨지는) 2,000여 종 이상의 관절형 객체 데이터를 제공하여, 시뮬레이션 학습이 실제 가정 환경의 복잡성을 반영할 수 있도록 돕는다.20

5. GPU 시뮬레이션이 연 심투리얼(Sim-to-Real)의 새 지평

GPU 병렬 시뮬레이션의 도약은 단순히 학습 속도만 높인 것이 아니다. 이는 “시뮬레이션과 현실의 간극(Reality Gap)“을 메우는 방법론에도 근본적인 변화를 가져왔다.

5.1 대규모 도메인 랜덤화 (Massive Domain Randomization)

과거 CPU 기반 시뮬레이션에서는 연산 비용 때문에 물리 파라미터(마찰, 질량, 댐핑 등)를 소극적으로 랜덤화할 수밖에 없었다. 그러나 GPU 기반 시뮬레이터에서는 수천 개의 환경마다 서로 다른 물리 파라미터를 할당하는 비용이 거의 ’공짜’에 가깝다.

  • 강건한 정책의 출현: “Learning to Walk in Minutes” 21 연구는 Isaac Gym을 활용하여 대규모 도메인 랜덤화를 적용했을 때, 단 20분의 학습만으로도 ANYmal 4족 보행 로봇이 다양한 험지를 주파하는 정책을 학습할 수 있음을 입증하였다. 수만 개의 다양한 물리 조건(마찰이 극도로 낮거나, 로봇의 모터 힘이 약하거나, 바닥이 울퉁불퉁한 경우 등)을 동시에 경험한 에이전트는 현실 세계의 불확실성을 시뮬레이션 내의 ‘노이즈’ 중 하나로 인식하고 강건하게 대응한다.
  • 적응형 커리큘럼: GPU의 병렬성은 에이전트의 성취도에 따라 환경의 난이도(지형의 거칠기 등)를 개별적으로 조절하는 게임 기반 커리큘럼(Game-inspired Curriculum)을 가능하게 하여 학습의 수렴성을 보장한다.21

5.2 액추에이터 모델링과 시스템 식별

현실 세계 전이 실패의 주원인은 로봇의 관절 구동기(Actuator) 모델의 부정확성이다. Isaac Lab과 같은 최신 프레임워크는 실제 로봇 데이터로부터 학습된 **액추에이터 넷(Actuator Net)**을 시뮬레이션 루프에 포함시킨다.22

  • 단순한 PD 제어기 모델 대신, 실제 모터의 지연(Delay), 마찰, 비선형 응답 특성을 모사하는 신경망을 GPU 시뮬레이션의 일부로 구동한다.
  • 이를 통해 시뮬레이션상의 토크 명령과 실제 로봇의 움직임 사이의 괴리를 최소화하며, Unitree Go1이나 Boston Dynamics Spot과 같은 로봇의 고난도 동작(예: 공 던지기, 무거운 물체 들기)을 정교하게 학습시킬 수 있다.22

5.3 시각적 도메인 랜덤화의 가속

ManiSkill 등에서 지원하는 고속 렌더링은 텍스처, 조명, 카메라 위치 등을 매 프레임 무작위로 변경하는 시각적 도메인 랜덤화를 가능하게 한다. 이는 로봇이 특정 색상이나 패턴에 과적합(Overfitting)되는 것을 방지하고, 현실 세계의 다양한 조명 조건에서도 물체를 인식하고 조작할 수 있는 능력을 부여한다.24

기능CPU 시뮬레이션 시대GPU 병렬 시뮬레이션 시대
도메인 랜덤화제한적 (수십 개 변형)대규모 (수만 개 변형 동시 실행)
Sim-to-Real 전략시스템 식별(SysID)에 의존강건함(Robustness) 극대화 및 Actuator Net 활용
시각적 학습렌더링이 병목, 저해상도 사용고해상도, Ray-tracing, 실시간 수백 배 속도
학습 소요 시간수일 ~ 수주수분 ~ 수시간

표 3.4.2-2. GPU 시뮬레이션 도입 전후의 Sim-to-Real 전략 변화

6. 주요 플랫폼 상세 비교 및 선택 가이드

연구자나 개발자가 자신의 목적에 맞는 시뮬레이터를 선택하기 위해서는 각 플랫폼의 장단점을 명확히 파악해야 한다. 다음은 2025년 현재 시점에서 주요 GPU 시뮬레이터들의 특성을 비교한 것이다.

플랫폼Isaac Lab (Isaac Gym)MuJoCo MJXGoogle BraxGenesisManiSkill (SAPIEN)
기반 기술PhysX 5, CUDA, OmniverseMuJoCo, JAX, XLAJAX, XLA자체 Universal EnginePhysX, Vulkan/CUDA
개발 언어Python (PyTorch)Python (JAX)Python (JAX)PythonPython (PyTorch/JAX)
주요 강점산업 표준, 방대한 자산, 강력한 렌더링, ROS2 연동물리 정확도, 유체/연체 지원 미흡하나 강체에 최적미분 가능성, RL 알고리즘 내장, 가벼움압도적 속도, 생성형 AI, 다물리(유체/연체) 통합조작(Manipulation) 특화, 고품질 렌더링, 상호작용 객체
데이터 파이프라인Zero-Copy Tensor APIJAX JIT/VMAPJAX JIT/VMAPGPU NativeRender Server
학습 속도 (상대적)매우 빠름매우 빠름빠름극도로 빠름 (43M FPS)빠름 (Visual RL 최적화)
추천 대상로봇 공학 전반, 상용 로봇 배포, Sim2Real제어 이론 연구, 모델 기반 RL, 정확한 물리 필요 시대규모 진화 연산, 미분 가능 RL 연구최신 생성형 AI 연구, 다물리 시뮬레이션비전 기반 로봇 조작, 가정용 서비스 로봇

표 3.4.2-3. 주요 GPU 병렬 시뮬레이션 플랫폼의 상세 비교

7. 결론 및 미래 전망

3.4.2절에서 살펴본 바와 같이, GPU 병렬 시뮬레이션 기술은 로봇 학습의 속도와 규모를 근본적으로 변화시켰다. Isaac Gym이 촉발한 GPU 네이티브 파이프라인 혁명은 MuJoCo MJX와 Brax를 통해 미분 가능 물리학이라는 새로운 도구와 결합하였고, Genesis와 ManiSkill을 통해 범용성과 시각적 사실성까지 확보하는 단계로 진입하였다.

이러한 기술적 진보가 시사하는 바는 명확하다.

첫째, 데이터의 민주화이다. 이제 고가의 슈퍼컴퓨터 없이도 개인 연구자가 단일 GPU 워크스테이션에서 수십억 스텝의 데이터를 생성하고 최첨단 로봇 정책을 학습시킬 수 있게 되었다.

둘째, 범용 로봇 모델(Foundation Model for Robotics)의 가능성이다. LLM이 인터넷상의 방대한 텍스트로 학습되었듯, 초고속 시뮬레이터는 로봇 파운데이션 모델 학습에 필요한 무한한 물리적 상호작용 데이터를 제공할 수 있는 유일한 원천이다. Genesis와 같은 플랫폼이 생성형 AI와 결합하여 시뮬레이션 환경 자체를 자동 생성하게 되면, 로봇은 인간이 일일이 설계하지 않은 수억 가지의 상황을 가상 공간에서 미리 경험하고 학습하게 될 것이다.

결국 시뮬레이션 기술의 도약은 로봇이 ’제한된 실험실’을 벗어나 ’복잡한 실제 세계’로 나아가는 가교(Bridge) 역할을 넘어, 로봇 지능의 탄생을 가속화하는 인큐베이터로서 그 역할을 확장하고 있다. 앞으로 우리는 물리 엔진의 정확도 향상과 렌더링의 사실성 증대, 그리고 이를 뒷받침하는 하드웨어의 발전이 맞물려, 시뮬레이션과 현실의 경계가 더욱 희미해지는 시대를 목격하게 될 것이다.

8. 참고 자료

  1. CPU vs. GPU for Machine Learning - IBM, https://www.ibm.com/think/topics/cpu-vs-gpu-machine-learning
  2. High Performance GPU Based Physics Simulation For Robot Learning, https://datasets-benchmarks-proceedings.neurips.cc/paper/2021/file/28dd2c7955ce926456240b2ff0100bde-Paper-round2.pdf
  3. Introducing NVIDIA Isaac Gym: End-to-End Reinforcement Learning …, https://developer.nvidia.com/blog/introducing-isaac-gym-rl-for-robotics/
  4. Tensor API — Isaac Gym documentation, https://docs.robotsfan.com/isaacgym/programming/tensors.html
  5. (PDF) Isaac Gym: High Performance GPU-Based Physics Simulation …, https://www.researchgate.net/publication/354116052_Isaac_Gym_High_Performance_GPU-Based_Physics_Simulation_For_Robot_Learning
  6. Isaac Lab: A GPU-Accelerated Simulation Framework for Multi …, https://arxiv.org/html/2511.04831v1
  7. MuJoCo-XLA Simulator (MJX) - Emergent Mind, https://www.emergentmind.com/topics/mujoco-xla-mjx
  8. mujoco/mjx/tutorial.ipynb at main · google-deepmind/mujoco · GitHub, https://github.com/google-deepmind/mujoco/blob/main/mjx/tutorial.ipynb
  9. Brax - A Differentiable Physics Engine for Large Scale Rigid Body …, https://arxiv.org/pdf/2106.13281
  10. Brax - A Differentiable Physics Engine for Large Scale Rigid Body…, https://openreview.net/forum?id=VdvDlnnjzIN
  11. google/brax: Massively parallel rigidbody physics simulation on …, https://github.com/google/brax
  12. Brax ❤️ MuJoCo = MJX · google brax · Discussion #409 - GitHub, https://github.com/google/brax/discussions/409
  13. Genesis-Embodied-AI/Genesis: A generative world for … - GitHub, https://github.com/Genesis-Embodied-AI/Genesis
  14. Genesis, https://genesis-embodied-ai.github.io/
  15. complete specification for the Genesis project. - GitHub Gist, https://gist.github.com/ruvnet/8003207bbe8870b0bbb9c2635f1824ba
  16. The Genesis Physics Platform Explained | by Omey Salvi - Medium, https://medium.com/technology-hits/the-genesis-physics-platform-explained-5f07b235dee9
  17. ManiSkill2: A Unified Benchmark for Generalizable Manipulation Skills, https://liner.com/review/maniskill2-a-unified-benchmark-for-generalizable-manipulation-skills
  18. MANISKILL3: GPU PARALLELIZED SIMULATION AND …, https://openreview.net/pdf/37c2f8270aab82a8f0dcb37b7036ea5910f6f66f.pdf
  19. zhuoqun-chen/ManiSkill3: SAPIEN Manipulation Skill Framework, a …, https://github.com/zhuoqun-chen/ManiSkill3
  20. SAPIEN: A SimulAted Part-Based Interactive ENvironment - Liner, https://liner.com/review/sapien-simulated-partbased-interactive-environment
  21. Learning to Walk in Minutes Using Massively Parallel Deep …, https://www.researchgate.net/publication/354858981_Learning_to_Walk_in_Minutes_Using_Massively_Parallel_Deep_Reinforcement_Learning
  22. Bridging the Sim-to-Real Gap for Athletic Loco-Manipulation - arXiv, https://arxiv.org/html/2502.10894v1
  23. Closing the Sim-to-Real Gap: Training Spot Quadruped Locomotion …, https://developer.nvidia.com/blog/closing-the-sim-to-real-gap-training-spot-quadruped-locomotion-with-nvidia-isaac-lab/
  24. Scaling up Manipulation Tasks in Simulation through Internet Videos, https://arxiv.org/html/2502.09886v1